Wanneer u de telefoon opneemt om te bellen, staat u er dan bij stil wat er allemaal in een toestel moet zitten om een optimale geluidsoverdracht te garanderen? Inzichten in een complex onderwerp.
De contactpersoon begrijpen en door hem begrepen worden is de basis van goede communicatie. Dit geldt voor elke vorm van verbale uitwisseling. Gesproken taal onderscheidt zich van gebaren en gezichtsuitdrukkingen tekens, aangezien het de betekenis van wat er wordt gezegd duidelijker overbrengt. Zelfs een korte pauze voor een woord of een iets andere klemtoon kan een bewering een andere betekenis geven.
Daarom is het van het grootste belang dat stemmen tijdens het telefoongesprek nauwkeurig worden overgebracht. Zonder vertraging, zonder vervorming. In het ideale geval moet het klinken alsof de gesprekspartners zich in dezelfde ruimte bevinden. Maar hoe wordt dit eigenlijk bereikt? Wanneer analoog in digitaal wordt omgezet en digitaal in analoog, wordt het gecomprimeerd. Verpakt, uitgepakt – en toch ontstaat er iets dat als een individuele “stem” kan worden onderscheiden. Een klein wonder.* Een korte blik achter de schermen laat zien wat er in IP-telefonie nodig is voor een goede audiokwaliteit.
Wat veroorzaakt vervorming?
Bij digitale communicatie wordt het gesproken woord door codecs gedigitaliseerd en in datapakketten gecomprimeerd. Het pad dat de datapakketten nu volgen (routing) is echter ook belangrijk. Het is van cruciaal belang dat alle datapakketten in de juiste volgorde en op het juiste moment aankomen. Gebeurt dit niet, dan is er sprake van “jitter”, een variatie in de looptijd van datapakketten, die wordt waargenomen als een “haperende” of “metaalachtige” stem. Dit komt vaak voor bij zogenaamde “gratis” telefoonkanalen zoals Skype en soortgelijke diensten, waar geen onderscheid wordt gemaakt tussen bestanden voor spraaktransmissie en andere formaten. Hier worden de spraakbestanden niet geprioriteerd en komen zij vaak onnauwkeurig of met vertraging aan bij de ontvanger.
Een ander probleem doet zich voor wanneer de gekozen internet-verbinding te zwak is: afhankelijk van de gebruikte codec zijn tussen 3 Kbit/s – GSM – en 128 Kbit/s – G711-G722 – per verbinding nodig voor een goede spraakoverdracht. Aangezien spraak geprioriteerd is, wordt het netwerk aanvankelijk vertraagd. Maar vervolgens wordt er overgeschakeld op een codec met een minimaal verbruik. Dit kan ook leiden tot een verslechtering van de geluidskwaliteit.
Kwaliteit is geen toeval
Zelfs wanneer deze hindernissen met succes zijn genomen, is een goede spraakoverdracht verre van gegarandeerd. Helemaal wanneer we kijken naar het volgende potentiële kwetsbare punt: de behuizing van de telefoon!
Het begint allemaal met het eerste ontwerp van de eindapparatuur en de optimale plaatsing van de luidsprekers en microfoons. Dit is afhankelijk van de toepassingsgebieden, of het nu in de handset of in handsfree systemen is. Voor de volgende stap moet de keuze van de gebruikte hardwarecomponenten worden gecoördineerd. Compatibiliteit tussen de componenten is hier ook belangrijk, om ervoor te zorgen dat alle onderdelen optimaal samenwerken en de prestaties voor het efficiënt coderen en verzenden van data in realtime beschikbaar zijn.
Bij Snom wordt de audiokwaliteit van een nieuw product gecontroleerd zodra het eerste industriële ontwerp beschikbaar is. Dit wordt voortgezet en geoptimaliseerd vanaf de eerste kunststof proefmodellen en gedurende de gehele levenscyclus van het product. Dankzij zijn eigen ervaring en audiolaboratorium is de in Berlijn gevestigde fabrikant er in de loop der jaren in geslaagd de geluidskwaliteit van zijn producten voortdurend te verbeteren door de nieuwste DSP-algoritmen te combineren met zijn knowhow op het gebied van VoIP-signalering. Snom is er met name terecht trots op dat het de verschillende problemen die kenmerkend zijn voor de VoIP-technologie, zoals verwerkings- en netwerkvertragingen, netwerkpakketverliezen en interferentie, heeft opgelost.
Het is deze bijzondere aandacht voor details tijdens de ontwerpfase die van cruciaal belang is bij het onderscheiden van de spraakkwaliteit in telefoons. Subjectieve tests zijn net zo belangrijk als objectieve tests. Een objectief goed afgestelde telefoon kan in de praktijk nog steeds een slechte geluidskwaliteit bieden. Onder goed afgestemde audio-apparatuur verstaat Snom apparatuur waarbij een cyclus van objectieve instellingen wordt gevolgd door een fase van subjectieve sessies, waarna beide beoordelingen aan alle eisen voldoen – zowel op het gebied van hoorakoestiek als van handsfree systemen.
Audiokwaliteit wordt door de meeste gebruikers als vanzelfsprekend beschouwd. Toch wordt zelfs vandaag de dag de complexiteit en verfijning van deze technologie pas duidelijk wanneer men de vaak slechte geluidskwaliteit van de meest geavanceerde smartphones of design desktopapparatuur ondervindt.
* Meer informatie over digitale spraaktransmissie vindt u hier: https://www.snom.com/solutions/audio/